TUGAS LAB IF540 MACHINE LEARNING

WEEK [12] : [Reinforcement Learning]

Semester Ganjil 2022/2023


Dataset yang dipakai:

  1. [Nama dataset1] – sumber : [cantumkan link dataset]
  2. [Nama dataset2] – sumber : [cantumkan link dataset]

Hasil kerja

Kesimpulan

Berikan simpulan yang dilakukan dari hasil kerja menggunakan algoritma dan 2 dataset yang dipilih. Simpulan bisa berkisar antara (bisa di modifikasi):

- Reinforcement learning dengan menggunakan Q-values berguna untuk meningkatkan kemampuan belajar dari suatu agent. Metode ini menggunakan Action Values, Rewards dan Episodes, Temporal Difference, dan memilih aksi dengan aturan epsilon-greedy.
- Bot ini juga bisa dilatih dengan Environment Clues, sehingga ketika di training dengan menggunakan kasus nyata, bot akan terlatih lebih realistis.
- Dengan menggunakan environment Taxi-v3, pelatihat bot terlihat lebih realistis lagi karena kasusnya kita hampir temui di kehidupan sehari-hari
- SARSA adalah On Policy dan menggunakan aksi yang telah dilakukan dengan autran yang sedang berlaku untuk memperlajari Q-value. Kemudian percobaan dilakukan dengan encironment FrozenLake-v1, Terlihat agent bisa memilih jalur jalan sesuai dengan keadaan yang ia temui. Untuk percobaan ini saya membuat total episode menjadi 1000 karena ketika 10000, laptop saya tidak kuat, dan bila 4000-5000 size IPYNG terlalu besar.

Save the notebook, then convert the notebook to html (by running the next code).

Next step:

Markdown basics https://markdown-guide.readthedocs.io/en/latest/basics.html#